CS►parallel computing-高性能计算►-cuda

cuda并行编程

cuda

cuda全程 Compute Unified Device Architecture.

2009年nvidia引入tesla架构，创造了cuda。

cuda是专门为Nvidia GPU的提供的C/C++ API，是GPU计算资源的高层抽象(兼容不同架构、不同版本GPU)。

它的核心是三个关键的抽象——

线程组的层次结构(hierarchy of thread groups):
共享内存(shared memories):
障碍同步(barrier synchronization):

它们只是作为最小的语言扩展集公开给程序员。

这些抽象提供细粒度数据并行性和线程并行性，嵌套在粗粒度数据并行性和任务并行性中。

扩展阅读